隐私已成为机器学习的主要问题。实际上,联合学习是出于隐私问题而激发的,因为它不允许传输私人数据,而仅传输中间更新。但是,联邦学习并不总是保证隐私保护,因为中间更新也可能揭示敏感信息。在本文中,我们对高斯混合模型的联合期望最大化算法进行了明确的信息理论分析,并证明了中间更新可能导致严重的隐私泄漏。为了解决隐私问题,我们提出了一个完全分散的隐私解决方案,该解决方案能够安全地计算每个最大化步骤中的更新。此外,我们考虑了两种不同类型的安全攻击:诚实但有趣而窃听的对手模型。数值验证表明,就准确性和隐私水平而言,与现有方法相比,所提出的方法具有优越的性能。
translated by 谷歌翻译
观察是理解和研究人类行为和精神状态的重要工具。但是,编码人类行为是一项耗时,昂贵的任务,在这种任务中,可靠性可能难以实现,偏见是一种风险。机器学习(ML)方法提供了提高可靠性,降低成本并扩展行为编码以在临床和研究环境中应用的行为编码的方法。在这里,我们使用计算机愿景来得出黄金标准行为评级系统的行为代码或概念,为精神卫生专业人员提供熟悉的解释。从有或没有强迫症的儿童和青少年的临床诊断访谈视频中提取了特征。我们的计算评级与人类的专家评级相当,在负面情绪,活动水平/唤醒和焦虑方面。为了关注和积极影响概念,我们的ML等级表现合理。但是,凝视和发声的结果表明需要提高数据质量或其他数据方式。
translated by 谷歌翻译
TSNE和UMAP是两个最流行的降低算法,因为它们的速度和可解释的低维嵌入。但是,尽管已经尝试改善TSNE的计算复杂性,但现有方法无法以UMAP的速度获得TSNE嵌入。在这项工作中,我们表明,通过将两种方法组合为单一方法,这确实是可能的。我们从理论上和实验上评估了TSNE和UMAP算法中参数的完整空间,并观察到单个参数(归一化)负责在它们之间切换。反过来,这意味着可以切换大多数算法差异而不会影响嵌入。我们讨论了这对基于UMAP框架的几种理论主张的含义,以及如何将它们与现有的TSNE解释调和。基于我们的分析,我们提出了一种新的降低性降低算法GDR,该算法结合了先前来自TSNE和UMAP的不兼容技术,并可以通过更改归一化来复制任何一种算法的结果。作为进一步的优势,GDR比可用的UMAP方法更快地执行优化,因此比可用的TSNE方法快的数量级。我们的实施是使用传统的UMAP和TSNE库的插件,可以在github.com/andrew-draganov/gidr-dun上找到。
translated by 谷歌翻译